[Day 29] 第四週心得：實作中我真的學到的那些事

2025 iThome 鐵人賽

DAY 29

生成式 AI

30天生成式AI入門與實作日記系列第 29 篇

17th鐵人賽

口瓜

2025-10-13 09:24:10

141 瀏覽

分享至

這禮拜我覺得最有趣的不是把程式跑起來，而是從實作的過程中，慢慢真的懂AI在做什麼。
今天這篇就不寫程式，單純整理幾個我這次做AI問答機器人過程中學到的觀念。

Tokenizer是怎麼讓模型看懂文字的
一開始我只知道要先載入Tokenizer，然後把文字轉成token，但實際操作之後才發現，Tokenizer根本就是模型的「語言轉譯器」。
我們打進去的文字，其實會先被切成一堆數字編碼，模型不是直接看句子，而是看這些token在語料中的位置與關係。
這也讓我理解為什麼有時候中英文混著寫會怪怪的，因為Tokenizer切法不同，會影響模型看到的內容。
Prompt設計真的會改變結果
在做摘要和翻譯的時候，我一開始都只是寫「Summarize this text」或「Translate this」。
後來發現如果加上更明確的規則，例如：

Produce EXACTLY three English sentences.
Each sentence ≤ 25 words.
No extra text.

生成結果就會明顯更穩定。
這讓我發現，Prompt其實不只是指令，而是在教模型你想要的風格和格式。
好的Prompt可以少debug一半的時間。
3. 模型不是萬能的，它只是有條件的聰明
在做問答時，有時候AI答錯，我會覺得它是不是壞掉了。
但後來才懂，模型其實不是真的理解內容，它是根據訓練時見過的資料分佈在預測下一個字。
所以如果我問它沒看過的題材，它會憑語感亂猜。
這也是為什麼有RAG這種技術出現，讓AI在回答前可以先查資料。
4. Hugging Face是整個開源AI界的寶庫
這次專案是我第一次用Hugging Face來登入、抓模型。
以前只覺得它是個模型倉庫，但這次才知道它還能管理token、追蹤版本、甚至幫忙部署。
而且每個模型頁面都有範例code，照著跑就能少出錯。
5. 能動不代表能用
這是我這次最大的體悟。
程式跑得起來只是第一步，但要讓別人看得懂、能順利使用、結果穩定，那才是真的在做一個應用。
這就是我後來會去寫使用手冊的原因。